语种识别

首页

语种识别

列表

默认

浏览次数

发布日期

3D

3D-Speaker是一个多模态开源项目，专注于通过结合声学、语义和视觉信息，实现高精度的说话人识别和语种识别。其主要功能包括说话人日志、说话人识别、语种识别、多模态识别以及重叠说话人检测。项目提供了工业级模型、训练与推理代码，以及多样化数据集，并支持复杂环境下的语音处理任务。应用场景涵盖会议记录、法庭记录、广播制作、电话客服和安全监控等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 575 浏览

语种识别 首页 语种识别

列表 默认 浏览次数 发布日期

3D

语种识别

首页

语种识别

列表

默认

浏览次数

发布日期